高考志愿指南之学科录取排行榜
本文作者:孙雪丽
文字编辑:王碧琪
技术总编:李春涛
好消息!!!爬虫俱乐部将于2019年7月5日至7月8日在武汉举行首期Python编程技术定制培训。本次培训采用理论与案例相结合的方式,旨在帮助零基础学员轻松入门Python,由浅入深学习和掌握Python爬虫技术,并明确未来更进一步的学习方向。
详细培训大纲及报名方式,请点击文末阅读原文呦~
高考结束,学弟学妹们即将面临成绩出炉、志愿填报。在推出《经济学专业录取分数线排行榜》后,特别是近期,我们收到许多读者咨询各省及各个专业的历史平均分。因而,在此志愿填报之际,我们充分利用Python及Stata各自的优势,特地爬取并整理了新浪教育高考院校库中的专业分数线数据,根据这一数据计算了各学科及各省份的历史录取平均分,并对31个省份历史平均分进行主成分分析(PCA)提取一个综合变量以反应高校在各省份报考的难度系数,得到大学报考综合难度排行榜。
先来看看各学科历史平均分排名前15的学校有哪些。
01哲学
02经济学
03法学
04教育学
05文学
06历史学
07理学
08工学
09农学
10医学
11军事学
12管理学
其后,我们运用31个省的历史平均分数据进行主成分分析,得到第一主成分的方差贡献率为87%,即第一主成分包含31个省份历史平均分的信息总量达到87%,因此我们可以选取第一主成分作为评价高校在各省报考难度的综合系数。得到2008-2017年以来大学报考的难度排名:
爬虫俱乐部将于2019年8月22日至28日在湖北武汉举行为期一周的Stata编程技术定制培训,此次采取初级班和高级班分批次培训。课程通过案例教学模式,旨在帮助大家在短期内掌握Stata软件编程、金融计量知识和实证分析方法,使大家熟悉Stata核心的爬虫技术,以及Stata与其他软件交互的高端技术。
初级班主要是为了让学员掌握Stata数据分析技巧,并能独立撰写相关的程序。涉及内容包括多种数据格式的读取和输出、数据的合并、实证结果的输出以及爬虫俱乐部编写的命令介绍等。
高级班主要是为了让学员掌握Stata软件进阶操作,涉及内容包括正则表达式、网络爬虫技巧、文本分析等技术。经过团队精心策划,此次课程新增北大法宝裁判文书信息提取和百度地图api调用两大案例,以及新兴实证研究方法介绍,相信定能让学员受益匪浅!
扫描下方二维码提交报名信息→缴费→发送缴费截图至statatraining@163.com(邮件主题为“爬虫俱乐部2019暑期Stata培训+姓名+单位+班次”)→报名成功。
后记
关于高考,小编印象深刻的是高考结束的那个下午,走在回学校宿舍的路上,突然非常难过,无关发挥,而是发觉那亦苦亦乐的高中生活我再也回不来了,那一刻的我拥有着无限广阔的未来,也失去了无比宝贵的过去,高中生活从此只能在记忆中出现,原来不是高考完就能彻底解放、就能满心欢喜,实则是五味杂陈。愿高考结束的学弟学妹前程似锦,也愿还在为高考奋斗的学弟学妹珍惜当下,毕竟,时间过去了,再也不会回来。
多年后,上完大学,坐过的火车足以绕赤道好几圈的小编终于明白,高考只是我们人生的一部分,学习才是人生的主旋律,无论高考如何,学习不会也不该因高考的结束而放松。在这个机器学习的时代,懂些编程技术不会让我们的生活更差,只会更好,毕竟,国奖、优质offer、保送清华都真真实实地发生在爬虫俱乐部。因此,我们诚邀有志于报考经济、金融、会计的学弟学妹们参加我们暑期的Python训练营,学习爬虫技术,让你的大学生活更加出彩。
对爬虫俱乐部的推文累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫!
往期推文推荐
关于我们
微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。
此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。